Lausnir

1 Stæði

1.a Fjöldi bílastæði á hvert póstnumer

1.b Fjöldi bílastæða á hvern eiganda

  • Sá einstaki eigandi sem á flest bílastæði er Reykjavíkurborg
  • Skráður eigandi á flestum bílastæðum er Lóðarhafi en það er ekki einn stakur eigandi heldur ólíkir eigendur á milli lóða
  • Samtals eru 146115 bílastæði í gagnasettinu
  • Skráningu vantar fyrir eiganda á 32 bílastæðum

2 Kort

Kort af bílastæðum í Reykjavík eftir eiganda

  • Hnit bílastæðanna rúnnuð að 3 aukastöfum (fyrir lat er viðbættur fjórði aukastafur rúnnaður á næsta 5)
  • Þetta hliðrar staðsetningu ögn en gefur þó rétta mynd af dreifingu bílastæðanna
  • Handahófs-örhniki er einnig bætt við til að minnka yfirteiknun.
  • Stærð hvers punkts á kortinu ræðst af heildarfjölda stæða á því hniti.

3 Join

“Joinun” taflanna og fyrstu 20 raðir útkomunnar

f_parking %>% 
  left_join(d_calendar, by = 'sk_time') %>% 
  left_join(d_parking, by = 'sk_parking')
sk_parking sk_time usage year month_number long lat x_isn y_isn postnumer landnumer gjaldskyld eigandi
1 1 52 2011 1 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 2 31 2011 2 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 3 50 2011 3 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 4 63 2011 4 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 5 37 2011 5 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 6 23 2011 6 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 7 42 2011 7 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 8 25 2011 8 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 9 51 2011 9 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 10 64 2011 10 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 11 43 2011 11 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 12 45 2011 12 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 13 53 2012 1 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 14 34 2012 2 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 15 48 2012 3 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 16 79 2012 4 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 17 40 2012 5 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 18 73 2012 6 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 19 41 2012 7 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)
1 20 35 2012 8 -21.74052 64.13594 366591.4 406566.6 113 206069 Ógjaldskylt (Vantar)

4.a Data Exploration

Data Exploration

  • Notkun nokkura bílastæða af handahófi

  • Mánaðarleg heildarnotkun allra bílastæða

  • Mánaðarleg heildarnotkun bílastæða eftir póstnumeri

  • Hafa eigandur og gjaldskylda áhrif á dreifingu notkunar?

Niðurstöður:
  • Ólík dreifing á notkunargildum eftir póstnúmerum
    • Ólík þróun (trend) notkunar eftir póstnúmerum
    • Sama árstíðarsveifla virðist vera í öllum póstnúmerum
    • Hvorki gjaldskylda né eigandi virðast hafa áhrif á dreifingu notkunargilda

4.b Módel

Decomposition

  • Miðað við niðurstöður að ofan þarf módel að taka tillit til árstíðarsveiflu, trends og póstnúmers
  • Graf að neðan sýnir decomposition á þessum þáttum fyrir hvert póstnúmer

Módel val

ARIMA models are quite good at forecasting non-stationary, seasonal timeseries. They allow for a lot of flexibility using its parameters, which can be automatically tuned using R. - ARIMA módel henta mjög vel til módela non-stationary, árstíðarbundin gögn - Parametrar leyfa mikinn sveigjanleika - Greining á heildargögnum gefur parametrana ARIMA(0,1,1)(2,1,0)[12] sem eru notaðir á hvert póstnúmer, til að koma í veg fyrir overfitting

Grafið að neðan sýnir niðurstöður þess að fitta ARIMA módelið við hvert póstnúmer. Til samanburðar er bætt inn einföldu línulegu módeli sem tekur ekki til greina árstíðarsveiflu.

Spáskekkja módels

  • Til að greina nákvæmni módelsins er það fittað við gögn 2011-2016 og spá þess borin saman við raungögn 2017-2019
  • Hér er spá m.v. raun fyrir tvö ólík póstnúmer

  • Munur á spá og raungögnum um notkun 2017-2019 er 0,06%

Notkun 2020

  • Til að spá um notkun 2020 er módel fittað á öll gögnin.
  • Notkun 2020 skv. módeli:

Áætluð notkun 2020: 205.023.051 ± 618.096 (0.3%)